1 / 34

image.png

Machine Learning

Apprentissage automatique

In [ ]:
 

2 / 34

image.png

Qu'est ce que le Machine Learning

Definition

L'apprentissage automatique (en anglais Machine Learning) est une branche de l'informatique, (l'intelligence artificielle) qui confère aux ordinateurs la capacité (d’apprendre) de generer des applications (modèles) à partir des données sans être explicitement programmés.
In [ ]:
 

3 / 34

image.png

Qu'est ce que la Machine Learning

Le but

Le but de machine learning est d'essayer de resoudre une tache pratique (exemple reconnaitre une voiture) . Il consiste en la mise en place d’algorithmes ayant pour objectif d’obtenir un algorithme à partir d'analyse predictive et statistique des données d'apprentissage. Ce modele va par la suite etre evalué et amelioré avec d'autres données que le modele n'a jamais vu, avant d'etre implementé en production une fois que le taux de reussite est jugé satisfaisant.
In [ ]:
 

4 / 34

Machine Learning vs data mining image.png

* Data Mining :

retraiter les données déjà connues pour en sortir des propriétés et des précisions encore inconnues. (Pattern)

* Machine Learning :

apprendre aux systèmes à prédire ce que pourrait être le résultat des données nouvelles à partir de données connues. (Application)
In [ ]:
 

5 / 34

Machine Learning vs big data

image.png

In [ ]:
 

6 / 34

Machine Learning vs Cloud

image.png

CLOUD COMPUTING

Le cloud computing /k</a>laʊd kəmˈpjuːtɪŋ/</span>[1], en français l'informatique en nuage[2],[3] (ou encore l'infonuagique[3] au Canada), correspond à l’accès à des services informatiques (serveurs, stockage, mise en réseau, logiciels) via Internet (le « cloud » ou « nuage ») à partir d’un fournisseur[4]. </p>

Les principaux services proposés en cloud computing sont le SaaS (Software as a Service), le PaaS (Platform as a Service) et le IaaS (Infrastructure as a Service) ou le MBaaS (Mobile Backend as a Service). On distingue généralement trois types de cloud : le cloud public — accessible par Internet —, le cloud d'entreprise ou privé — accessible uniquement sur un réseau privé —, le cloud intermédiaire ou hybride — qui est une combinaison entre le cloud public et le cloud privé. Le cloud computing permet aux entreprises de minimiser les coûts d'infrastructure informatique[réf. nécessaire] et de bénéficier d'une adaptation des ressources en fonction des fluctuations de l'usage, avec cependant une augmentation notable des coûts d'exploitation du réseau.

CLOUD COMPUTING

image-2.png

In [ ]:
 

CLOUD SERVICE image.png

IAAS CAAS PAAS FAAS image-2.png

Exemple ecosysteme plateforme GCP

image.png

Exemple ecosysteme: plateforme AWS

image.png

In [ ]:
 

Exemple ecosysteme : ML sur plateforme Azure

image.png

Dataiku

In [ ]:
 
In [ ]:
 

6 / 34

Machine Learning Vs IA

image.png


7 / 34

Machine Learning vs Deep learning

image.png

image.png

Autres

image.png

MLOPS

image.png

image.png

image.png

image.png

image.png

image.png

image.png


8 / 34

Cycle de projet Machine Learning

image.png

image.png

In [ ]:
 

9 / 34

Cycle de projet Machine Learning image.png

image.png

In [ ]:
 

image.png

In [ ]:
 

image.png image.png

10 / 34

les differents types d'apprentissage automatique

● L’apprentissage supervisé (Supervised Learning)

● L’apprentissage non supervisé (Unsupervised Learning)

● L’apprentissage par renforcement (Reinforcement Learning)

● L’apprentissage par transfert

image.png

11 / 34

les differents types d'apprentissage automatique

image.png

In [ ]:
 

Scikit-learn est une bibliothèque libre Python destinée à l'apprentissage automatique. Elle est développée par de nombreux contributeurs2 notamment dans le monde académique par des instituts français d'enseignement supérieur et de recherche comme Inria3.

image.png


12 / 34

Apprentissage supervisé

In [ ]:
 

13 / 34

Apprentissage supervisé

ML Algorithm Classes Algorithm Names

image.png

In [ ]:
 

14 / 34

Apprentissage non supervisé image.png

image.png


15 / 34

Apprentissage par renforcement (Reinforcement Learning)

Méthode consiste à laisser l’algorithme apprendre de ses propres erreurs. Afin d’apprendre à prendre les bonnes décisions, l’intelligence artificielle se retrouve directement confrontée à des choix. Si elle se trompe, elle est ” pénalisée “. Au contraire, si elle prend la bonne décision, elle est ” récompensée “. Afin d’obtenir toujours plus de récompenses, l’IA va donc faire de son mieux pour optimiser sa prise de décisions.

image.png

image.png


16 / 34

Regression

C'est une méthode statistique qui permet d'analyser et comprendre la relation entre deux ou plusieurs variables d'intérêt. Le processus aide à comprendre quels variables sont les plus influents, et lequelles pourraient etre ignorés, en estimant les interactions entre les differents facteurs analysés. 

image.png

image.png


Regression lineaire

La régression linéaire est un modèle de régression qui cherche à établir une relation linéaire entre une variable, dite expliquée, et une ou plusieurs variables, dites explicatives.

image.png

image.png

image.png

La regression logistique

La régression logistique est une technique de classification utilisée pour les problèmes de classification binaire tels que la classification des tumeurs comme malignes / non malignes, la classification des e-mails comme spam / non spam. 

il est classé dans les algorithme de classification

image.png

La régression logistique ou modèle logit est un modèle de régression binomiale. Comme pour tous les modèles de régression binomiale, il s'agit de modéliser au mieux un modèle mathématique simple à des observations réelles nombreuses. En d'autres termes d'associer à un vecteur de variables aléatoires (x1,..xk) une variable aléatoire binomiale génériquement notée y

Elle s'utilise lorsque la variable à expliquer (variable dépendante Y) est qualitative, le plus souvent binaire. Les variables explicatives (variables indépendantes Xi) peuvent être par contre soit qualitatives, soit quantitatives. La variable dépendante est habituellement la survenue ou non d'un événement (maladie ou autre) et les variables indépendantes sont celles susceptibles d'influencer la survenue de cet événement c'est-à-dire les variables mesurant l'exposition à un facteur de risque ou à un facteur protecteur, ou variable représentant un facteur de confusion.

image.png

In [ ]:
 

Regression polynomiale

image.png

Ce type de technique de régression est utilisé pour modéliser des équations non linéaires en prenant des fonctions polynomiales de variables indépendantes. 


image.png

image.png

In [ ]:
 

In [ ]:
 

19 / 34

Presentation Python

Python (/ˈpaɪ.θɑn/5) est un langage de programmation interprété, multi-paradigme et  multiplateformes. Il favorise la programmation impérative structurée, fonctionnelle et  orientée objet. Il est doté d'un typage dynamique fort, d'une gestion automatique de la mémoire par ramasse-miettes et d'un système de gestion d'exceptions ; il est ainsi similaire à Perl, Ruby, Scheme, Smalltalk et Tcl.

Le langage Python est placé sous une licence libre proche de la licence BSD6 et fonctionne sur la plupart des plates-formes informatiques, des smartphones aux  ordinateurs centraux7, de Windows à Unix avec notamment GNU/Linux en passant par macOS, ou encore Android, iOS, et peut aussi être traduit en Java ou .NET. Il est conçu pour optimiser la productivité des programmeurs en offrant des outils de  haut niveau et une syntaxe simple à utiliser.

In [ ]:
 

21 / 34

Presentation Pandas

Pandas est une librairie python qui permet de manipuler facilement des données à analyser :

manipuler des tableaux de données avec des étiquettes de variables (colonnes) et d'individus (lignes).
ces tableaux sont appelés DataFrames, similaires aux dataframes sous R.
on peut facilement lire et écrire ces dataframes à partir ou vers un fichier tabulé.

22 / 34

Presentation Sklearn

Scikit-learn est une bibliothèque libre Python destinée à l'apprentissage automatique. Elle est développée par de nombreux contributeurs2 notamment dans le monde académique par des instituts français d'enseignement supérieur et de recherche comme Inria3.

Elle propose dans son framework de nombreuses bibliothèques d’algorithmes à implémenter clé en main, à disposition des data scientists. 

23 / 34

TP Regression avec Boston Maison

In [ ]:
 

24 / 34

Presentation ORANGE

Orange est un logiciel libre d'exploration de données (data mining). Il propose des fonctionnalités de modélisation à travers une interface visuelle, une grande variété de modalités de visualisation et des affichages variés dynamiques2

25 / 34

Tree : Decision Tree


25 / 34

Classification : KNN , SVM


25 / 34

Clustering : KMeans


25 / 34

Dimension reduction : PCA


In [ ]:
 

26 / 34

TP avec IRIS

In [ ]:
 

In [ ]:
 
In [ ]:
 

image.png